HS 2025
LV-Leitung: Dr. Sandra Grinschgl / MSc. Aaron Friedli
Tutor: BSc. Lars Schilling
10. Einheit, 19.11.2025
Fortsetzung Datenqualität -> Folien EH 9
Zuerst Theorie, dann Hands-On
Haben alle einen Long Datensatz (e.g. dat_full_long) mit 318 Zeilen = 2 Zeilen pro Versuchsperson?
Wenn nicht:
❗Falls ihr bis Ende Lektion noch nicht den LONG Datensatz erstellt und gespeichert habt - meldet euch bei uns
Schritt 1: Deskriptive Tabelle erstellen mit summarize
penguins_full <- drop_na(penguins)
penguins_summary <- penguins_full |>
group_by(species) |>
summarize(mean_body_mass = mean(body_mass_g),
min_body_mass = min(body_mass_g),
max_body_mass = max(body_mass_g)
)
penguins_summary# A tibble: 3 × 4
species mean_body_mass min_body_mass max_body_mass
<fct> <dbl> <int> <int>
1 Adelie 3706. 2850 4775
2 Chinstrap 3733. 2700 4800
3 Gentoo 5092. 3950 6300
Schritt 2: kable auf deskriptive Tabelle anwenden
library(knitr)
penguins_summary |>
kable(
caption = "Summary of penguin body mass by species",
digits = 1,
col.names = c("Species", "Mean body mass (g)", "Min", "Max")
)| Species | Mean body mass (g) | Min | Max |
|---|---|---|---|
| Adelie | 3706.2 | 2850 | 4775 |
| Chinstrap | 3733.1 | 2700 | 4800 |
| Gentoo | 5092.4 | 3950 | 6300 |
Weitere Formatierungen möglich, z.B. row.names, col.names…siehe Hilfefunktion
apaTables - APA konforme Tabellen von statistischen AnalysenKorrelationstabelle im APA Format –> Kann man auch für Regressionen und ANOVAs verwenden
1.Schritt: Auswahl von Variablen
apaTables - APA konforme Tabellen von statistischen Analysen2.Schritt: Korrelationstabelle for ausgewählte Variablen
Speichert Tabelle als Word Datei
ggplot2()Sehr flexibles Paket.
Alle plots beginnen mit ggplot() und dem verwendeten Datensatz
Mit aes() definieren wir die elemantaren Elemente der Plots - Variablen die geplottet werden sollen
mit + können wir geoms, layers und weitere Elemente hinzufügen.
ggplot2() - Cheatsheet
ggplot()Variablen als Aestheatic Mappings defineren
Mapping ist immer das zweite argument, “call” kann also auch verkürzt werden.
ggplot() - Geomsgeom_bar()geom_histogram()geom_point(), geom_line()geom_count()geom_boxplot(), geom_violin()ggplot() - Layersggplot() - Layerslabs), Regressionslinien, vereinfachtes Designmit theme_ können verschiedene Formatierungen gewählt werden. theme_classic wird typischerweise für APA7 passende Formatierungen gewählt.
ggplot() - Verschiedene Layers/Geoms kombiniertViel, viel mehr Möglichkeiten als wir hier besprechen, siehe z.B.:
R for Data Science – Kapitel 9 & 10:
Kapitel „Layers“
Weitere Textelemente in Abbildungen (Kapitel 11)
Hier findet man auch weitere Visualisierungsmöglichkeiten & Informationen dazu, wie man verschiedene Plots neben/untereinander abbilden kann.
Muddiest Points besprochen
Basics der Datenvisualisierungen kennengelernt
Erstellung von Tabellen
ggplot()
Reminder: Beim Abschlussprojekt müsst ihr 1 Tabelle oder Abbildung nach Wahl zu den simulierten Daten abgeben.
Abgabe bis Freitag 28.11.2025, 23:55
Peerfeedback bis Mittwoch 03.12.2025 (vor der Einheit)
Achtung: Einhalten der Namensvorgaben!